智能论文笔记

Habitat classification from satellite observations with sparse annotations

Mikko Impiö , Pekka Härmä , Anna Tammilehto , Saku Anttila , Jenni Raitoharju

分类：计算机视觉

2022-09-26

与现场测量相比，遥感益处可以通过使大面积的监控更容易地进行栖息地保护，尤其是在可以自动分析遥感数据的情况下。监测的一个重要方面是对受监视区域中存在的栖息地类型进行分类和映射。自动分类是一项艰巨的任务，因为课程具有细粒度的差异，并且它们的分布是长尾巴且不平衡的。通常，用于自动土地覆盖分类的培训数据取决于完全注释的分割图，从遥感的图像到相当高的分类学，即森林，农田或市区等类别。自动栖息地分类的挑战是可靠的数据注释需要现场策略。因此，完整的分割图的生产成本很高，训练数据通常很稀疏，类似点，并且仅限于可以步行访问的区域。需要更有效地利用这些有限数据的方法。我们通过提出一种栖息地分类和映射的方法来解决这些问题，并应用此方法将整个芬兰拉普兰北部地区分类为Natura2000类。该方法的特征是使用从现场收集的细粒，稀疏，单像素注释，并与大量未经通知的数据结合在一起来产生分割图。比较了监督，无监督和半监督的方法，并证明了从较大的室外数据集中转移学习的好处。我们提出了一个\ ac {cnn}偏向于中心像素分类，与随机的森林分类器结合使用，该分类器比单独的模型本身产生更高的质量分类。我们表明，增加种植，测试时间的增加和半监督的学习可以进一步帮助分类。

translated by 谷歌翻译

Domain-specific transfer learning in the automated scoring of tumor-stroma ratio from histopathological images of colorectal cancer

Liisa Petäinen , Juha P. Väyrynen , Pekka Ruusuvuori , Ilkka Pölönen , Sami Äyrämö , Teijo Kuopio

分类：计算机视觉 | 机器学习

2022-12-30

Tumor-stroma ratio (TSR) is a prognostic factor for many types of solid tumors. In this study, we propose a method for automated estimation of TSR from histopathological images of colorectal cancer. The method is based on convolutional neural networks which were trained to classify colorectal cancer tissue in hematoxylin-eosin stained samples into three classes: stroma, tumor and other. The models were trained using a data set that consists of 1343 whole slide images. Three different training setups were applied with a transfer learning approach using domain-specific data i.e. an external colorectal cancer histopathological data set. The three most accurate models were chosen as a classifier, TSR values were predicted and the results were compared to a visual TSR estimation made by a pathologist. The results suggest that classification accuracy does not improve when domain-specific data are used in the pre-training of the convolutional neural network models in the task at hand. Classification accuracy for stroma, tumor and other reached 96.1$\%$ on an independent test set. Among the three classes the best model gained the highest accuracy (99.3$\%$) for class tumor. When TSR was predicted with the best model, the correlation between the predicted values and values estimated by an experienced pathologist was 0.57. Further research is needed to study associations between computationally predicted TSR values and other clinicopathological factors of colorectal cancer and the overall survival of the patients.

translated by 谷歌翻译

Joint Non-parametric Point Process model for Treatments and Outcomes: Counterfactual Time-series Prediction Under Policy Interventions

Çağlar Hızlı , ST John , Anne Juuti , Tuure Saarinen , Kirsi Pietiläinen , Pekka Marttinen

分类：机器学习

2022-09-09

决策者需要在采用新的治疗政策之前预测结果的发展，该政策定义了何时以及如何连续地影响结果的治疗序列。通常，预测介入的未来结果轨迹的算法将未来治疗的固定顺序作为输入。这要么忽略了未来治疗对结果之前的结果的依赖性，要么隐含地假设已知治疗政策，因此排除了该政策未知或需要反事实分析的情况。为了应对这些局限性，我们开发了一种用于治疗和结果的联合模型，该模型允许估计处理策略和顺序治疗（OUT COMECTION数据）的影响。它可以回答有关治疗政策干预措施的介入和反事实查询，因为我们使用有关血糖进展的现实数据显示，并在此基础上进行了模拟研究。

translated by 谷歌翻译

Deformation equivariant cross-modality image synthesis with paired non-aligned training data

Joel Honkamaa , Umair Khan , Sonja Koivukoski , Leena Latonen , Pekka Ruusuvuori , Pekka Marttinen

分类：计算机视觉 | 机器学习

2022-08-26

跨模式图像合成是一个主动研究主题，具有多个医学临床相关的应用。最近，允许对配对但未对准数据进行培训的方法开始出现。但是，没有适用于广泛的现实世界数据集的健壮且良好的方法。在这项工作中，我们通过引入新的变形均衡性鼓励损失函数，对跨模式图像合成问题的问题提出了一个通用解决方案。该方法包括对图像合成网络的联合培训以及单独的注册网络，并允许在输入上进行对抗训练，即使使用未对准数据。这项工作通过允许对更困难的数据集进行跨模式图像合成网络的毫不费力培训来降低新的临床应用程序的标准，并为开发新的基于通用学习的跨模式注册算法开发机会。

translated by 谷歌翻译

HTML版本

Realistic mask generation for matter-wave lithography via machine learning

Johannes Fiedler , Adrià Salvador Palau , Eivind Kristen Osestad , Pekka Parviainen , Bodil Holst

分类：机器学习

2022-07-15

快速生产具有纳米分辨率的大面积模式对于已建立的半导体行业和实现下一代量子设备的工业规模生产至关重要。具有二进制全息掩模的亚稳定原子光刻被认为是当前最新水平的较高分辨率/低成本替代方法：极端紫外线（EUV）光刻。然而，最近表明，亚稳定原子与掩模材料（SIN）的相互作用导致波前的强烈扰动，而不是基于经典标量波。这意味着即使在1D中也无法在分析上解决逆问题（基于所需模式创建掩码）。在这里，我们提出了一种机器学习方法，以掩盖产生的目标是亚稳定性原子。我们的算法结合了遗传优化和深度学习来获得面具。一种新型的深神经结构经过训练，可以产生面膜的初始近似。然后，该近似值用于生成可以收敛到任意精度的遗传优化算法的初始种群。我们证明了Fraunhofer近似极限内系统维度的任意1D模式的产生。

translated by 谷歌翻译

Look beyond labels: Incorporating functional summary information in Bayesian neural networks

Vishnu Raj , Tianyu Cui , Markus Heinonen , Pekka Marttinen

分类：机器学习 | 人工智能 | (统计)机器学习

2022-07-04

贝叶斯深度学习提供了一种原则性的方法来训练神经网络，以说明造成这种不确定性和认知不确定性。在各种推理中，先验通常是在权重参数上指定的，但它们并未捕获大型和复杂的神经网络体系结构中的真实先验知识。我们提出了一种简单的方法，以结合有关贝叶斯神经网络（BNN）中预测概率（例如Sigmoid或SoftMax评分）输出的摘要信息。可用的摘要信息被合并为增强数据，并以Dirichlet过程进行建模，我们得出相应的\ emph {摘要证据下限}。我们展示了该方法如何为模型提供有关任务难度或班级失衡的信息。广泛的经验实验表明，在可忽略的计算开销中，提出的方法产生了BNN，并具有更好的不确定性校准。

translated by 谷歌翻译

Cross-boosting of WNNM Image Denoising method by Directional Wavelet Packets

Amir Averbuch , Pekka Neittaanmäki , Valery Zheludev , Moshe Salhov , Jonathan Hauser

分类：计算机视觉

2022-06-09

该论文通过将基于定向准分析小波包（QWP）与最新的加权核定标准最小化（WNNM）denoising算法相结合，从而提出了图像降级方案。基于QWP的Denoising方法（QWPDN）由降级图像的多尺度QWP变换，使用双变量收缩方法的适应性局部软阈值应用于转换系数，以及从几个分解级别中恢复阈值系数的图像。合并的方法由QWPDN和WNNM算法的几个迭代组成，以每种迭代的方式，从一种算法中的输出将输入提高到另一个算法。提出的方法将QWPDN的功能融合在一起，即使在严重损坏的图像中捕获边缘和精细的纹理模式，并利用了WNNM算法固有的真实图像中的非本地自相似性。多个实验将所提出的方法与包括WNNM在内的六种高级denoing算法进行了比较，证实，在定量度量和视觉感知质量方面，合并的跨增强算法比大多数都优于大多数。

translated by 谷歌翻译

A Unified Review of Deep Learning for Automated Medical Coding

Shaoxiong Ji , Wei Sun , Hang Dong , Honghan Wu , Pekka Marttinen

分类：自然语言处理

2022-01-08

自动化医疗编码，医疗保健操作和交付的基本任务，通过从临床文献预测医学代码来实现非结构化数据。自然语言处理中深入学习模型的最新进展已被广泛应用于此任务。然而，它缺乏对医学编码的神经网络架构设计的统一视图。本综述提出了一个统一的框架，为医疗编码模型的构建块提供了一般性的理解，并概述了近期框架下的最新模型。我们的统一框架将医疗编码分解为四个主要组件，即文本特征提取的编码器模块，为构建深编码器架构的机制，解码器模块，用于将隐藏的表示转换为医学代码，以及辅助信息的使用。最后，我们讨论了关键的研究挑战和未来方向。

translated by 谷歌翻译

Quality of Data in Machine Learning

Antti Kariluoto , Arto Pärnänen , Joni Kultanen , Jukka Soininen , Pekka Abrahamsson

分类：机器学习

2021-12-17

根据哪种机器学习模型提高其性能，当他们有更多数据来学习时，存在常见的假设。在这项研究中，作者希望通过使用新颖的职业学生数据进行实证实验来澄清困境。该实验比较了不同的机器学习算法，同时改变了可用于训练和测试模型的数据数量和特征组合。实验表明，数据记录的增加或其样本频率不会立即导致模型精度或性能的显着增加，但是在集合模型的情况下，准确性的方差会减少。在增加模型的输入特征的数量的同时，目睹了类似的现象。该研究驳斥了起始假设，并继续说明，在这种情况下，数据的重要性在于数据的质量而不是数据的数量。

translated by 谷歌翻译

Multitask Balanced and Recalibrated Network for Medical Code Prediction

Wei Sun , Shaoxiong Ji , Erik Cambria , Pekka Marttinen

分类：自然语言处理

2021-09-06

人类编码人员将标准化的医疗法规分配给患者住院期间产生的临床文件，该文件容易出错且劳动力密集。使用机器学习方法（例如深神经网络）开发了自动化的医学编码方法。然而，由于冗长的文档中的班级问题，复杂的代码关联和噪音，自动化的医疗编码仍然具有挑战性。为了解决这些问题，我们提出了一个新型的神经网络，称为多任务和重新校准的神经网络。值得注意的是，多任务学习方案共享不同代码分支之间的关系知识以捕获代码关联。重新校准的聚合模块是通过级联卷积块来提取高级语义特征来开发的，从而减轻噪声在文档中的影响。同样，重新校准的模块的级联结构可以从冗长的音符中受益。为了解决类不平衡的问题，我们部署了焦点损失，以重新分布低频和高频医疗法规的注意力。实验结果表明，我们提出的模型在现实世界中的临床数据集模拟于III上优于竞争基线。

translated by 谷歌翻译